Análisis de similitud basado en grafos: Una nueva aproximación a la detección de plagio translingüe
نویسندگان
چکیده
Cross-language variant of automatic plagiarism detection tries to detect plagiarism among documents across language pairs. In recent years a few approaches are proposed that use thesauri, alignment models or statistical dictionaries to deal with the similarity across languages. We propose a new approach to the crosslanguage plagiarism detection that makes use of a multilingual semantic network to generate knowledge graphs, obtaining a context model for each document which the other methods lack. To evaluate the proposed method, we use the Spanish-English and German-English partitions of the PAN-PC’11 corpus and compare our results with two state-of-the-art approaches. Experimental results indicate its potential to be a new alternative for similarity analysis in cross-language plagiarism detection.
منابع مشابه
Generación Automática de Casos de Uso para Desarrollo de Software Basado en Reutilización
Resumen. El desarrollo de software con reutilización se basa en la selección adecuada de elementos reutilizables del repositorio. La generación automática de casos de uso es una opción para acelerar la definición precisa de los requisitos funcionales como paso inicial para el desarrollo de software con reutilización. Por lo anterior, en este artículo proponemos un marco de trabajo para normaliz...
متن کاملComparación de Representaciones Interválicas Hansonianas para Recuperación de Información Musical
La similitud melódica es un concepto importante a considerar en la recuperación de información musical. Algunas de las posibles aplicaciones son sistemas basados en contenido desarrollados para administración de derechos de autor, detección de plagio de ideas ya expuestas por un artista en el pasado, la asistencia a la composición, etc. Existen varias técnicas expuestas en similitud melódica qu...
متن کاملHerramienta de apoyo en la detección de reutilización de código fuente
Resumen. El acto de tomar parcial o totalmente contenidos generados por otras personas, y presentarlos como propios, sin dar el crédito correspondiente a los autores, es una forma indebida de reutilización de contenidos, considerada como plagio. Desafortunamente, en la actualidad, dada la amplia disponibilidad de contenidos a través de Internet, esta práctica se ha incrementado. La gran mayoŕıa...
متن کاملUna aproximación para resolución de ambigüedad estructural empleando tres mecanismos diferentes
Resumen La ambigüedad estructural es uno de los problemas más difíciles de resolver en sistemas de procesamiento de lenguaje natural. Consideramos dos tipos de resolución de ambigüedad estructural que pueden emplearse en el análisis de textos sin restricciones: conocimiento léxico y cierta clase de contexto. En este trabajo, proponemos un modelo basado en tres diferentes mecanismos para revelar...
متن کاملVerificación y Validación en el Ámbito del Desarrollo Basado en Modelos de Interfaces de Usuario
Resumen. En este trabajo, se presenta un enfoque para la verificación del diseño de interfaces de usuario. Nuestra aproximación se centra en el desarrollo basado en modelos propuesto por UsiXML, que considera cuatro niveles de abstracción: definición de tareas y conceptos, interfaz abstracta, concreta y final. Hemos añadido un proceso de validación y verificación basado en redes de Petri a esta...
متن کاملذخیره در منابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید
ثبت ناماگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید
ورودعنوان ژورنال:
- Procesamiento del Lenguaje Natural
دوره 50 شماره
صفحات -
تاریخ انتشار 2013